AI

الشركة الناشئة Anthropic متهمة بجمع البيانات بشكل عدواني من مواقع الويب

يندأ الناشرون عبر الإنترنت بالاحتجاج: يجمع المطور المحتويات بشكل غير مصرح به لتدريب الذكاء الصناعي ويتجاهل طلبات التوقف.

Eulerpool News ٢٨ يوليو ٢٠٢٤، ١:١٢ م

تُتهم شركة Anthropic الناشئة في مجال الذكاء الاصطناعي بجمع بيانات من المواقع الإلكترونية بشكل عدواني لتدريب أنظمتها، وربما تنتهك شروط الاستخدام الخاصة بالناشرين، وفقًا للأطراف المتضررة.

يَعتمد مطوّرو الذكاء الاصطناعي على كميات كبيرة من البيانات من مصادر متعددة لإنشاء نماذج لغوية ضخمة تُشكّل التكنولوجيا وراء روبوتات الدردشة مثل ChatGPT الخاص بشركة OpenAI ومنافسه كلود الخاص بشركة Anthropic.

تم تأسيس Anthropic بواسطة باحثين سابقين من OpenAI وتَعِد بتطوير أنظمة ذكاء اصطناعي "مسؤولة". ومع ذلك، يتهم مات باري، الرئيس التنفيذي لـ Freelancer.com، الشركة التي تتخذ من سان فرانسيسكو مقرًا لها بأنها "الأكثر عدوانية بكثير في جمع البيانات" من منصته للموظفين المستقلين التي تسجل ملايين الزيارات اليومية.

ناشرو الويب الآخرون يشتركون في مخاوف باري من أن شركة Anthropic تغمر مواقعهم وتتجاهل تعليماتهم بوقف جمع المحتويات. ووفقًا لباري، تلقى موقع Freelancer.com 3.5 مليون زيارة من زاحف ويب مرتبط بشركة Anthropic في غضون أربع ساعات. قال باري: "هذا على الأرجح نحو خمسة أضعاف الرقم الثاني".

أدت الزيارات من هذا البوت إلى الاستمرار في الزيادة، حتى بعد أن حاولت Freelancer.com رفض الوصول باستخدام البروتوكولات القياسية. قرر Barrie بعد ذلك حظر جميع حركة المرور من عناوين IP الخاصة بـAnthropics. "كان علينا حظرها لأنها لا تلتزم بقواعد الإنترنت"، قال Barrie. "هذا السحب الصارخ يبطئ الموقع لجميع المستخدمين ويؤثر في النهاية على إيراداتنا.

أنتروبيك أفادت بأنها تحقق في القضية وتحترم طلبات الناشرين بعدم "التطفل أو الإزعاج".

استخراج البيانات المتاحة للجمهور عمومًا قانوني، لكن يمكن أن ينتهك شروط استخدام المواقع وقد يكون مكلفًا لمشغلي المواقع. قال كايل وينز، الرئيس التنفيذي لموقع iFixit.com، إن موقعه لإصلاح الإلكترونيات تلقى مليون زيارة من روبوتات Anthropics خلال 24 ساعة. "لدينا العديد من التنبيهات لحركة المرور العالية التي توقظ الناس في الساعة الثالثة صباحًا. وقد أطلقت هذه التنبيهات جميع إنذاراتنا"، قال.

تشترط شروط استخدام iFixit عدم استخدام بياناتها لأغراض التعلم الآلي. "رسالتي الأولى إلى Anthropic هي: إذا استخدمتم ذلك لتدريب نموذجكم، فإن ذلك غير قانوني. ورسالتي الثانية هي: هذا ليس سلوكاً مهذباً على الإنترنت. الزحف هو مسألة تتعلق بالإتيكيت.

تستخدم المواقع بروتوكول "robots.txt" لمنع الزواحف والروبوتات الأخرى من الوصول إلى أجزاء معينة من صفحاتها، ولكن ذلك يعتمد على الامتثال الطوعي. قالت شركة Anthropic إن زواحفها تحترم "التقنيات المضادة للتحايل" مثل اختبارات CAPTCHA وأن "عملية الزحف التي نقوم بها لا ينبغي أن تكون تدخلاً أو مزعجة".

تزايد استخراج البيانات بشكل كبير في العامين الماضيين بسبب سباق التسلح في مجال الذكاء الاصطناعي، مما تسبب في تكاليف جديدة لمشغلي المواقع الإلكترونية. كتب إريك هولشر، المؤسس المشارك لموقع استضافة الوثائق "Read the Docs"، في منشور على المدونة: "زواحف الذكاء الاصطناعي تسببت لنا في تكاليف كبيرة من النطاق الترددي وخصصنا الكثير من الوقت للتعامل مع إساءة الاستخدام.

لقد أنشأت Anthropic بعضًا من أكثر برامج الدردشة تقدمًا في العالم لتنافس ChatGPT الخاص بـ OpenAI وتضع نفسها كجهة أخلاقية. الهدف المعلن لـ Anthropic هو "التطوير المسؤول وصيانة الذكاء الاصطناعي المتقدم لتحقيق فائدة طويلة الأمد للبشرية".

بينما تطور الشركات الرائدة في مجال الذكاء الاصطناعي نماذج أكثر قوة، تتوغل أعمق في زوايا غير مستكشفة من الإنترنت، وتتعاون مع الناشرين أو تنشئ بيانات تدريب اصطناعية. وقامت OpenAI في الأشهر الأخيرة بإبرام عدة صفقات مع ناشرين ومزودي محتوى مثل Reddit، وThe Atlantic، وThe Financial Times. ولم تعلن Anthropic عن شراكات مماثلة بشكل علني.

قال باري: "لطالما قامت محركات البحث بالكثير من التجميع، لكن مع تدريب الذكاء الاصطناعي التوليدي، ارتفع الأمر إلى مستوى جديد تمامًا".

مهمة iFixit هي مشاركة المعلومات لتشجيع الناس على إصلاح الأشياء بأنفسهم. قال "وينس"، "ليس لدينا مشكلة في أن يستخدموا محتوياتنا لأغراض التدريب النموذجي، نريد فقط أن نكون جزءاً من المناقشة." وأضاف، "أنا لست صليبيًّا في هذا الموضوع، أحاول فقط الحفاظ على موقع الويب على الإنترنت.

استثمر بأفضل طريقة في حياتك
fair value · 20 million securities worldwide · 50 year history · 10 year estimates · leading business news

بدءًا من 2 يورو

أخبار